package com.samp.solr.hanlp;

import com.hankcs.hanlp.HanLP;
import com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary;
import com.hankcs.hanlp.seg.Segment;
import com.hankcs.hanlp.seg.common.Term;

import java.util.List;

/**
 * hanlp会先从默认路径中读取，如果读取失败，再读取配置文件中的信用词。
 * 通常情况下，用这个核心停用词典是不错的选择，里面有不少默认词。
 * 但想要自己控制，就只用自己用List.removeAll()来删除了，比如navi场景。
 */
public class StopWordsDemo {

    private static Segment segment= HanLP.newSegment().enableCustomDictionary(true);

    private static void defaultStopWordsDemo(String text){
        List<Term> termList=segment.seg(text);
        System.out.println(termList);
        CoreStopWordDictionary.apply(termList);
        System.out.println(termList);
    }

    private static void customStopWordsDemo(String text){

    }

    public static void main(String[] args) {
        String text = "今天是个好天气，我的精神又好些了，时候也不早了";
        defaultStopWordsDemo(text);

    }
}
